首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏我爱计算机视觉

    AI + 3D!英伟达开源3D深度学习框架Kaolin

    点击我爱计算机视觉标星,更快获取CVML新技术 ---- 3D计算机视觉在医学影像、自动驾驶、机器人深度感知、视频游戏、虚拟和增强现实中有重要应用。 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计算机视觉的研究。其基于PyTorch实现,包括主流3D视觉数据表示的读取和3D计算机视觉的可微分模块。 将大大降低3D计算机视觉研究的进入门槛。 ? Kaolin 实现了可微分的 rendering, lighting, shading, and view warping,同时也支持常见的损失函数和度量标准,也可于计算后无缝渲染3D结果。 Kaolin支持的3D计算机视觉任务: ?

    89610发布于 2019-12-30
  • Cursor + BlenderMCP : AI自动3D建模

    前言在开发前端3d项目时建模一直是一个比较头疼的事,各种五花八门的软件例如blender,maya, 3d Max等等,光是听到就很头疼更别说去学习具体的建模操作,笔者也学过一段时间的blender发现只学了点皮毛还容易忘 ,最近mcp很火就想着有没有什么可以介入建模软件的mcp,让ai帮我自动建模,于是便找到本文的主角-blender-mcp操作指南1. 同时BlenderMCP也支持接入三方AI,例如Hyper3d以及fal ,感兴趣的小伙伴自行体验一下吧!

    1.9K10编辑于 2025-05-14
  • 来自专栏星流全栈

    AI通过照片创建3D模型,3D建模师也要失业?

    之前,我们提到了【两分钟论文#161】AI创建用户界面,前端将失业?神器pix2code!搞得前端界人心惶惶。现在告诉前端界一个好消息,You are not alone! 3D建模领域未来也将被彻底颠覆! ? 各位同学大家好,又到了我们的「两分钟AI小课堂」。 今天我们来讲一下AI,尤其是DNN在3D建模中的应用。 通过照片和图像来还原3D模型是一个大胆的想法,之前也有许多人做过相关研究。 MIT的研究者们采用了3D-GAN网络来通过图片生成3D模型。 到时候,平面设计师还是3D建模师的工作量都会大大减轻! ? MIT的这篇文章研究3D对象生成的问题。 CAD模型的情况下对样本进行采样,并探索3D对象流形; 第三,对抗鉴别器提供了一个强大的3D形状描述符,它在没有监督的情况下学习,在3D对象识别中有广泛的应用。

    3.9K80发布于 2018-06-01
  • 来自专栏JNing的专栏

    3D人脸】AI Mesh 数据工程调研

    开源的假图只给了70个2d点,不给模型) [2022,微软] 3D face reconstruction with dense landmarks(直接完全沿用了自家2021的数据,没有任何改进,不给模型 开源了但不给点) [2018,上交/云从] Joint 3D Face Reconstruction and Dense Alignment with Position Map Regression Network (没细看) [2015,中科院] Face alignment across large poses: A 3d solution(没细看) semi-automatic refined data(半3dmm 半手动) [2016,CMU] Dense 3D face alignment from 2D videos in real-time(没细看) [2019,谷歌] Real-time facial surface

    85020编辑于 2022-11-14
  • 来自专栏AI科技大本营的专栏

    玩转3D全息图像!AI即刻生成

    该团队称之为“张量全息术”,并认为该方法可能会推动全息技术向VR和3D打印等领域的延伸。 训练神经网络通常需要庞大的高质量数据集,而3D全息图以前没有这种数据集。 研究人员创建的数据集具有三个重要功能,以使CNN能够学习逼真的3D全息图。 实时3D全息技术的应用将会惠及从VR到3D打印的众多系统,研究人员表示,该种新系统可以帮助VR观看者沉浸在更真实的风景中,同时消除长期使用VR带来的眼睛疲劳和其他副作用。 同时,三维全息术还可以促进3D打印技术的发展,该技术比传统的逐层3D打印更快、更精确,因为该项技术允许同时投影整个3D图形。

    1.8K20发布于 2021-03-25
  • 垂直堆叠3D芯片突破AI算力瓶颈

    研究人员创造了一种新型的3D计算机芯片,该芯片将存储和计算元件垂直堆叠,极大地加快了芯片内部的数据移动速度。与传统平面设计不同,这种方法避免了制约当前AI硬件的“交通拥堵”问题。 在硬件测试和模拟中,这款3D芯片的性能比2D芯片高出一个数量级。研究人员之前在学术实验室中制造过实验性3D芯片,但该团队表示,这是第一次在商业代工厂中生产出性能明显提升的芯片。 像这样的突破是我们实现未来AI系统所需的1000倍硬件性能提升的方式。” 平面芯片为何难以应对现代AI像ChatGPT和Claude这样的大型AI模型,不断地在存储信息的内存和处理信息的计算单元之间穿梭大量数据。 如果我们能制造出先进的3D芯片,我们就能更快地创新、更快地响应,并塑造AI硬件的未来。”这项研究在某大学、某机构、某大学和某理工学院进行,所有制造工作均在某机构的代工厂完成。资金来自多个机构和项目。

    22710编辑于 2026-03-26
  • AI生成隐藏3D图像的局限性分析

    隐藏3D图像的AI生成实验你是否见过那些隐藏着3D图像的自体立体图?就像1990年代的Magic Eye图片,看似嘈杂的重复图案,直到你以特定方式调节视觉焦距才能看到立体效果。 技术实现机制剖析当要求"生成独角兽魔法眼3D立体图像"时,ChatGPT传递给DALL-E3(实际负责图像生成的模型)的描述极其详细:需要包含复杂图案和多样化色彩以确保3D效果突出背景应包含神秘元素以增强深度幻觉独角兽的角和鬃毛应在图案中清晰可辨但 这些被宣传为"全能AI"的模型,实际更像装满应用的手机:文本生成应用可在特定情况下启动图像生成应用,但它们并非真正意义上的统一程序。 在生成ASCII文字艺术并自行读取时:在新会话中向其发送自生成的ASCII文字时,它识别为"ERROR"对自身创作的ASCII艺术品的识别和评级同样糟糕技术本质揭示生成ASCII艺术和3D图像并非ChatGPT 这再次证明了当前AI在多模态任务协同处理上的技术局限性。

    27410编辑于 2025-09-07
  • AI 3D建模工具对比 - InstantMesh vs TripoSR全面评测

    昨天刷到一个视频,有人用AI十几秒就做出了一个超精细的3D模型,我当时就想:这不可能吧?然后我就去找了两个最火的AI建模工具来测试——InstantMesh和TripoSR。 TripoSR 走的是“一步到位”路线,用大型重建模型直接从图片生成 3D,就像是看一眼照片就能在脑中瞬间构建立体模型,简单粗暴但高效。这种模式代表了 AI 建模的“极速派”。 如果你要做一个3D展示网站,用户上传照片立即看到3D效果,TripoSR几乎是唯一选择。服务器成本也可控,一台配置不算太高的GPU服务器就能支撑不少并发。 技术发展趋势这两个模型其实代表了AI建模的两个发展方向:快速化和精细化。TripoSR证明了实时3D生成的可行性,这为很多应用场景打开了大门。 想象一下,以后在电商网站上传商品照片,立即就能生成3D预览,这体验得多棒。InstantMesh则在质量上做了突破,让AI生成的3D模型真正达到了可用于生产的标准。

    87310编辑于 2025-07-23
  • 来自专栏AI科技大本营的专栏

    苹果发布 AI 生成模型 GAUDI,文字生成 3D 场景

    整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 前有DALL.E文本生成图像,现有将文字变成 3D场景。 近日,苹果 AI 团队发布最新 AI 模型 GAUDI,它是基于 3D 场景的神经架构 NeRFs,可以根据文字生成 3D 室内场景。 2021 年末时,谷歌通过 Dream Fields 首次展示了 3D AI 生成系统,将 NeRF 生成 3D 视图的能力与 OpenAI 的 CLIP 评估图像内容的能力相结合。 苹果 AI 团队发布的 GAUDI 是一种能够生成沉浸式 3D 场景的神经架构,可以根据文字提示创建 3D 场景。 例如,输入“穿过走廊”或“上楼梯”,就可以看到执行这一动作的 3D 场景视频。 Apple GAUDI 是 3D 内饰专家 虽然谷歌致力于使用 Dream Fields 生成单个对象,但将生成 AI 扩展到完全不受约束的 3D 场景仍是一个尚未解决的问题。

    96720编辑于 2022-12-09
  • 腾讯混元生3D产品概要:基于自研大模型的AI 3D内容生成平台

    一、 产品定位与核心亮点 产品定义:腾讯混元生3D是一款基于腾讯自研大模型的AI 3D内容生成平台。 适用于平台大量商品3D化转换,以及客户DIY装修素材的批量生产场景。 平台工具厂商:面向具备丰富网站AI能力及素材工具的平台,作为底层AI能力插件,补充并完善平台的3D素材生成链路。 案例2:Lovart 背景:属于AI技术行业,自身定位为平台工具厂商,拥有丰富的网站AI能力和素材工具,需要进一步拓展3D维度的生成能力。 解决方案:将腾讯混元生3D集成至其平台工具矩阵中。 痛点在于普通用户获取可打印的优质3D模型门槛过高,制约了打印机的使用频次。 解决方案:接入AI 3D内容生成平台能力。 解决方案:应用腾讯混元生3D能力支持其打印生态。 成效:依托提升70%的生产效率,赋能用户快速产出3D打印源文件,形成“AI生成-直接打印”的业务闭环。

    19710编辑于 2026-04-21
  • 来自专栏机器之心

    3D AI生成出新玩法了:无需数小时,只要45秒,单张图片即可生成 3D模型

    机器之心专栏 机器之心编辑部 45 秒单张图片变 3D,无需大量 3D 数据和逐物体优化。 3D AI 生成最近发展得如火如荼,不少最新工作都能够从一句话 / 一张图生成高质量的三维模型。 这种方式使得现有的 3D AI 生成方法都非常耗时,譬如 ProlificDreamer 的作者就曾在知乎上表示方法目前的主要局限之一便是生成时间太慢了! 方法 由于 3D 数据的稀缺性,学术界最近的绝大多数 3D AI 生成工作都通过利用 2D 扩散生成模型来指导 3D 表示(如 NeRF)的优化,从而实现 3D 内容生成。 与现有 3D AI 生成方法的比较 研究者表示,得益于 “2D 多视角预测 + 3D 可泛化重建” 的技术路线,One-2-3-45 与现有的 3D AI 生成方法相比,除了推断时间显著降低外,还在输入的多样性 结语 One-2-3-45 提出了 “2D 多视角预测 + 3D 可泛化重建” 这样一项新颖的 3D AI 生成玩法,并在许多方面都展示出了其优越性。

    4.3K30编辑于 2023-08-07
  • 我用AI 3D,终于实现了我的手办自由。

    但是如今,让我自己再去建模那肯定不可能,C4D和Blender我打开都不想打开,作为一个AI博主,要是再回去手工建模,那简直就是就回到原始人了。 AI 3D必须安排上。 这一步,可以直接用Tripo AI,我心中目前最好的AI 3D平台,前段时间他们正好发了他们的2.0模型,精度强了非常非常多。 最关键的是,他们的图生3D,实在是太好了。 网址在此:https://www.tripo3d.ai/ 进去以后,可以直接传图,用图生3D,当然你要是就是想玩,直接文生3D也没啥问题。 一直以来,都不是3D打印不行,而是建模的成本,实在太高了。 感谢AI的发展,也感谢TripoAI,让我们的梦,可以具象化的变成现实。 这可能,就是AI 3D,还有Tripo的魅力。 现在,当AI 3D,摆在你面前,这些儿时的创意,也终于迸发出了无与伦比的想象力。 也能亲手,让我们把幻想变成现实。

    61910编辑于 2025-04-14
  • 来自专栏机器之心

    AI系统能否理解3D现实世界?Facebook做了这些研究

    选自Facebook AI 作者:Georgia Gkioxari、Shubham Tulsiani、David Novotny 参与:魔王 Facebook 的博客详细介绍了其在 3D 内容理解领域的研究进展 要想解释现实世界,AI 系统必须理解三维视觉场景。而这需要机器人学、导航,甚至增强现实应用等等。 计算机视觉领域覆盖大量任务,而 3D 理解将对推进 AI 系统更准确地理解、解释现实世界并在其中运行起到核心作用。 当 AI 系统与其他感官结合起来时,如触觉和自然语言理解,这些系统(如虚拟助手)可以更加无缝地发挥作用。这一前沿研究帮助我们向着构建和人类一样更直观理解三维世界的 AI 系统更进了一步。 原文链接:https://ai.facebook.com/blog/pushing-state-of-the-art-in-3d-content-understanding/ 本文为机器之心编译,转载请联系本公众号获得授权

    97010发布于 2019-12-31
  • 来自专栏机器之心

    3D视角洞悉矩阵乘法,这就是AI思考的样子

    选自PyTorch 机器之心编译 如果能以 3D 方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。 现如今,矩阵乘法已经成为机器学习模型的构建模块,是各种强大 AI 技术的基础,了解其执行方式必然有助于我们更深入地理解这个 AI 以及这个日趋智能化的世界。 这里可视化了此类表达式中形状最简单的一个 (A @ B) @ (C @ D): 3d 一点注解:分区和并行性 完整阐述该主题超出了本文的范围,但后面我们会在注意力头部分看到它的实际效用。

    77260编辑于 2023-10-04
  • 来自专栏arXiv每日学术速递

    3D视角洞悉矩阵乘法,这就是AI思考的样子

    选自PyTorch 机器之心编译 如果能以 3D 方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。 现如今,矩阵乘法已经成为机器学习模型的构建模块,是各种强大 AI 技术的基础,了解其执行方式必然有助于我们更深入地理解这个 AI 以及这个日趋智能化的世界。 这里可视化了此类表达式中形状最简单的一个 (A @ B) @ (C @ D): 3d 一点注解:分区和并行性 完整阐述该主题超出了本文的范围,但后面我们会在注意力头部分看到它的实际效用。

    75240编辑于 2023-10-06
  • 来自专栏机器之心

    AI技术让手办「整活」:3D建模居然可以这样简单

    3D 内容对于元宇宙至关重要,很多科技公司正在推出用于构建虚拟世界的工具,随着计算机图形技术、元宇宙和 AI 之间的交集越来越多,这些技术也在不断升级。 通过 AI 能力用 2D 照片生成 3D 模型,是人工智能学术会议中的一个热门领域,刚刚过去的国际顶会 CVPR 上就有数十篇这个方向的论文。 3D 建模,手机也行 快速构建 3D 模型的能力来自华为终端云服务开放能力合集 HMS Core,其拥有 3D 建模、3D 引擎、AR Engine 等多个图形领域的开放服务。 高精度的几何重建需要先进行物体分割,将目标物与背景分离,并进行图像匹配、特征提取和深度估计,AI 算法通过分析不同角度的图像来判断位置关系,生成点云构建 3D 模型,再计算出纹理材质对模型表面进行贴图。 华为利用 AI 算法减少了人为规则的需求,可以支持非对称的多种姿态。 面对模型的各种姿态,AI 算法需要大量数据进行训练,但在 3D 模型重建任务上,业内其实并没有这样的数据集。

    1.8K30编辑于 2022-09-01
  • 来自专栏ATYUN订阅号

    3D打印全光学固态神经网络,光速执行AI分析

    但是这个新系统不仅可见,而且是一个物体:它不是通过处理数字而是通过光的衍射来执行AI类型分析。这是奇怪而独特的,但恰恰证明了人工智能系统看起来可以多么的简单易行。 但来自加州大学洛杉矶分校的研究人员表明,它实际上可以固化,这些层本身就是真正的3D打印透明材料层,印有复杂的衍射图案,这些衍射图案可以对数字进行数学处理。

    49320发布于 2018-08-06
  • 来自专栏数据派THU

    AI指挥无人车队,中国造出世界最大3D打印建筑

    来源:新智元本文共2100字,建议阅读9分钟青海羊曲大坝建筑项目将由核心AI操控无人工程车队,用3D打印技术建造。 AI操控无人工程车队,建造羊曲大坝 该项目的首席科学家刘天云4月27日在《清华大学学报(自然科学版)》发布了相关研究论文——《大型填筑工程3D 打印技术与应用》,被多方报道时引用。 这篇论文中详细介绍了填筑工程中3D打印技术及AI和多种机器人的装备系统集成,论文中描述的此集成系统可以完全在无人干预下,由AI自行调度控制,逐层填筑,层层循环,直至完成整个填筑工程的3D打印建造。 在刘天云团队的设计下,羊曲水坝建筑工地实际上已经变成一台巨大的3D打印机,大量的无人驾驶工程车辆和设备,作为不同的打印机组件,在羊曲工程的核心AI规划下无缝地协同工作。 核心AI3D数字模型「切片」为一系列工序,进行土石坝分期、分区、分层的3D打印过程规划。 完成这步后,核心AI会组织与调度相关的工序,优化施工方案。

    46920编辑于 2022-06-07
  • 来自专栏新智元

    AI指挥无人车队,中国造出世界最大3D打印建筑

    ---- 新智元报道   编辑:袁榭 【新智元导读】青海羊曲大坝建筑项目将由核心AI操控无人工程车队,用3D打印技术建造。 AI操控无人工程车队,建造羊曲大坝 该项目的首席科学家刘天云4月27日在《清华大学学报(自然科学版)》发布了相关研究论文——《大型填筑工程3D 打印技术与应用》,被多方报道时引用。 这篇论文中详细介绍了填筑工程中3D打印技术及AI和多种机器人的装备系统集成,论文中描述的此集成系统可以完全在无人干预下,由AI自行调度控制,逐层填筑,层层循环,直至完成整个填筑工程的3D打印建造。 在刘天云团队的设计下,羊曲水坝建筑工地实际上已经变成一台巨大的3D打印机,大量的无人驾驶工程车辆和设备,作为不同的打印机组件,在羊曲工程的核心AI规划下无缝地协同工作。 核心AI3D数字模型「切片」为一系列工序,进行土石坝分期、分区、分层的3D打印过程规划。 完成这步后,核心AI会组织与调度相关的工序,优化施工方案。

    59230编辑于 2022-05-16
  • 2026年,3D新架构将让国产AI芯片“弯道超车”

    在12月20日举行的“第四届HiPi Chiplet论坛” 3D IC分论坛上,清微智能联合创始人兼首席技术官欧阳鹏表示,国产高端AI芯片有望在2026年通过3D可重构架构技术,实现对国际主流高端AI芯片的超越 国产AI芯片“弯道超车”主战场:3D可重构架构技术 不仅是学术层面,如今,3D可重构架构技术已经商业落地,并有望成为中国AI芯片“弯道超车”的主战场。 国内市场方面,国产AI芯片有望在2026年采用3D可重构新架构。 早在2019年,清微智能和清华大学团队就开展了3D可重构AI架构相关研究,自2023年1月开始,清微智能在中美进行3D芯片相关的大量专利布局。 截至2025年上半年,清微智能AI加速卡出货量位居国产商用类企业第一梯队。 此外,清微智能的新一代基于3D可重构架构技术的云端算力产品,计划2026年推出,将全面对标国际主流的高端AI芯片。

    62210编辑于 2026-03-20
领券